Código/Articulo_La complejidad del sistema geoelectoral mexicano a nivel municipal

Análisis de Agrupamiento y Estratificacion


Autor: Miguel David Alvarez Hernández (mdalvarezh@gmail.com)

Setup

Importación de datos procesados

Resultados de los escenarios PCA

Definición de la prueba de Hopkins (https://www.kaggle.com/ashydv/country-clustering-hierarchical-clustering-pca)


Agrupamiento y construcción de la estratificación de complejidad electoral

(7 indicadores, 3 CP)

Analisis de hopkins

Análisis de silueta, dendograma y configuración óptima de grupos con Ward

Cálculo de los silhouette_scores para diferentes números de clusters en ward

Dendrograma

Se elige la configuración de 4 clusters (es la tercera configuración con el mayor valor promedio de silueta, pero presenta un agrupamiento adecuado en la proyección bidimensional y en el dendrograma)

Análisis de silueta, dendograma y configuración óptima de grupos con complete linkage

Cálculo de los silhouette_scores para diferentes números de clusters en complete linkage

Dendrograma

Se elige la configuración de 3 clusters

Análisis de silueta, dendograma y configuración óptima de grupos con average linkage

Cálculo de los silhouette_scores para diferentes números de clusters en average linkage

Dendrograma

Análisis de silueta, dendograma y configuración óptima de grupos con single linkage

Cálculo de los silhouette_scores para diferentes números de clusters en single linkage

Dendrograma


Escenario 1: Estratificacion con Ward (4 clusters, 3 CP, 7 indicadores)

Se utiliza la última iteración guardada de Ward para asegurar la reproducibilidad de los resultados

Gráfica en el espacio CP1, CP2

Gráfica en el espacio CP1, CP2, CP3

Gráfica 3d animada


Análisis estadístico de los ICE y la estratificacion

Escenario 1: Ward

Gráficas (pair-plot, box-plots, violin-plots)

Plotgrid de gráficas de caja para cada indicador e índice de complejidad electoral (por grupo)

Gráfica de violín (por grupos, para el indicador "CP1")

Plotgrid de gráficas de violín para cada indicador e índice de complejidad electoral (por grupo)

Identificación de los valores/municipios atípicos (7 indicadores)

Etiquetamos los municipios considerados como atípicos en los ICE (considerando la separación por grupos de la tipología, y utilizando la regla intercuartil):

Función para calcular el Q1, Q3 e IQR (calculado por grupos de cluster_ward), y posteriormente clasificar los municipios en tipicos o atipicos en el ICE principal.

Estadisticas


Referencias